import pandas as pd
m = pd.read_excel('movie.xlsx')
# 月度票房前10名  2008-2019
m = m[m.MovieName!='其他']
# 删除电影名为其他的行
g = m.groupby(m.month.str[:4])
# 按年分组    2019-01
g.boxoffice.sum()
# 按年汇总票房
g.boxoffice.sum() / m.boxoffice.sum()
# 比率
g1 = m.groupby('MovieName')
# 按电影名分组
print(g1.size().sort_values(ascending=False)[:10])# 月度排名出现次数最多
